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1 

Beschreibung 

Verfahren und Vorrichtung zur Sprachverarbeitung 

5 Die Entwicklung alltagstauglicher Spracherkennungs- und 

Sprachsteuersysteme stellt seit Jahren eine der Hauptentwick- 
lungslinien der Computertechnik dar, Im Zuge dieser Entwick- 
lung wurden erhebliche Fortschritte erreicht und marktfahige 
Spracherkennungssysteme etabliert, die sich im praktischen 
10 Einsatz auch bewahren, Fortgeschrittene Systeme dieser Art 
sind auch grundsatzlich zur Sprachsteuerung eines Computers 
bzw. von angeschlossenen Peripheriegeraten geeignet. Einfache 
Spracherkennungssysteme, die allerdings nur ein relativ ge- 
ringes Vokabular verarbeiten konnen, werden auch bereits in 
15 den Bereichen Konsumelektronik und KFZ-Ausrustung sowie wei- 
teren Bereichen eingesetzt^ in denen eine akustische Steue- 
rung von Geraten aufgrund eines begrenzten Vokabulars mSglich 
und sinnvoll ist. 

20 Bei Spracherkennungssystemen gibt es in der Regel Werkzeuge, 
mit denen das vom Spracherkennungssystem zu erkennende Voka- 
bular eingegeben werden kann. In der Regel werden die Worter 
Oder AuBerungen iiber eine entsprechende Oberf lachen-Sof tware 
des Computerprogramms in orthographischer Schreibweise einge- 
geben und in die interne Schreibweise des Spracherkennungs- 
system (meist eine Variante von phonetischer Umschrift (Laut- 
schrift) ) automatisch umgesetzt. Bei diesem automatischen 
Oder durch Lexikon-Look-Up unterstiitzten KonversionsprozeB 
konnen Fehler in der phonetischen Umschrift entstehen, die 
30 aus unzulanglichen Umsetzungsregeln und/oder unvollstandigen 
Lexika herruhren. Da das Spracherkennungssystem seinen Erken- 
nungsprozeB auf der Basis dieser so erzeugten phonetischen 
Umschrift aufbaut, entstehen durch eine falsche phonetische 
Umschrift auch Fehler bei der Spracherkennung. 
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Um eine optimale Performance zu gewahrleisten, muR dafiir 
Sorge getragen warden, dafi die phonetische Umschrift mog- 
lichst luckenlos korrekt ist. 

5 Das Problem wurde bisher dadurch gelost^ daB der Benutzer 
nach Eingabe der orthographischen (korrekten) Schreibweise 
die vom System erzeugte phonetische Umschrift manuell prtifen 
konnte. Dies ist fiir ungeschultes Personal aber in der Kegel 
schwierig, Daher wurden verschiedene Hilfsmittel benutzt, die 
10 in der marktgangigen SW angeboten sind: 

1. Der Benutzer kann sich fur die verschiedenen lautlichen 
Symbole typische Worter, in denen solche Symbole enthalten 
sind/ anzeigen lassen. und die phonetische Schreibweise ma- 

15 nuell korrigieren. Hierbei wird er bei manchen Systemen noch 
dahingehend unterstUtzt, dafi keine falschen Zeichensequenzen 
der phonetischen Umschrift verwendet werden konnen, indem 
durch die eingesetzte Software nur solche Zeichenketten 
eingegeben werden konnen^ die eine gUltige ASCII-Folge fUr 

20 den verwendeten phonetischen Zeichensatz darstellen, 

2. Aus der phonetischen Schreibweise wird mit Hilfe von g^n- 
gigen Text-to-Speech-Sof twaresystemen, also Sprachsynthese- 
verfahren, die phonetische Umschrift wieder in eine horbare 

25 Sprache umgesetzt. Dies dient dem akustischen Plausibilitats- 
check der Phonemkette, die vom System fiir ein Wort automa- 
tisch erzeugt wurde. Dieser Hortest kann jedoch nur drasti- 
sche Fehler eliminieren und unterliegt den Unzulanglichkeiten 
des akustischen Kanals. Des weiteren ist eine Obereinstimmung 

30 der verwendeten phonetischen Alphabete der Spracherkennung 

wie auch der Sprachsynthese zu gewahrleisten, was in den we- 
nigsten Fallen gegeben ist. 
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Der Erfindung liegt daher die Aufgabe zugrunde, ein verbes- 
sertes Verfahren bzw. eine Vorrichtung zur Sprachverarbeitung 
anzugeben, die sich insbesondere durch wesentlich verbesserte 
Nutzerf reundlichkeit und im Zusammenhang hiermit auch durch 
5 erhohte Genauigkeit und Zuverlassigkeit auszeichnen. 

Diese Aufgabe wird hinsichtlich ihres Verf ahrensaspektes ge- 
lost durch ein Verfahren mit den Merkmalen des Anspruchs 1 
und hinsichtlich ihres Vorrichtungsaspektes durch eine Vor- 
0 richtung mit den Merkmalen des Anspruchs 6. 

Die Erfindung schlieBt den wesentlichen Gedanken ein, 
anstelle der fiir den sprachwissenschaf tlich ungeschulten Be- 
nutzer ungewohnten und nur schwer handhabbaren Ausgabe eines 
5 in phonetische Umschrift umgesetzten Wortes in dieser phone- 
tischen Umschrift (Lautschrif t ) eine einfache und zuverlassi- 
ger handhabbare Ausgabe vorzusehen. Sie schlieJit weiter den 
Gedanken ein, hierzu eine als "pseudo-orthographisch" zu be- 
zeichnende Ausgabeform zu wahlen, die vom Benutzer nicht die 
0 Kenntnis von Sonderzeichen der phonetischen Umschrift und von 
deren speziellen Regeln erfordert, Vereinfacht gesagt, 
erfolgt die Ausgabe der umgesetzten Worte "so, wie man sie 
spricht" . 

Diese auch fUr den Laien leicht verstandliche und gut zu 
handhabende pseudo-orthographische Ausgabe einer in phoneti- 
sche Umschrift umgesetzten Sprache erfordert einen zusatzli- 
chen Schritt im Sprachverarbeitungsverf ahren, namlich den 
Schritt der Umsetzung aus der phonetischen Umschrift in diese 
0 pseudo-orthographische Darstellung. Dieser zusatzliche 

Schritt beinhaltet ein Verfahren, bei dem in selbstlernender 
Weise oder unter Zugriff auf ein vorbestimmtes Regelwerk die 
phonetischen Einheiten der Worte in einfache graphematische 
Einheiten von geschriebener Schrift umgesetzt werden. Diese 
5 Umsetzung geschieht in einer einfachen und zweckmafiigen 

Ausfuhrung unter Zugriff auf eine gespeicherte Phonem-Gra- 
phem-Zuordnungstabelle, die mindestens mit einem Anfangsbe- 
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stand an Zuordnungsvorschrif ten initialisiert und ggf s . im 
Zuge eines Selbstlernprozesses wahrend der Anwendung des Sys- 
tems aufgrund zusatzlicher Eingaben durch den Nutzer erwei- 
terbar ist. 

5 

In einer besonders komf ortablen und im Sinne des erwahnten 
Selbstlernprozesses vorteilhaf ten AusfUhrung lomfaBt das Ver- 
fahren noch einen weiteren Umsetzungsschritt der umgekehrten 
Umsetzung aus einer (durch den Nutzer bei einer Eingabe zur 
10 Korrektur des primaren Umsetzungsergebnisses benutzten) 
pseudo-orthographischen Darstellung in die phonetische 
Umschrift. Auch bei diesem Schritt kann die erwahnte tabellaj 
rische Zuordnung genutzt und ggfs. im Zuge eines Selbstlern- 
prozesses erganzt und verfeinert werden. 



15 



Entsprechend den oben angegebenen Verf ahrensmerkmalen weist 
eine Vorrichtung zur Durchftihrung des vorgeschlagenen Verfah- 
rens neben einer an sich bekannten ersten Umsetzereinheit zur 
Umsetzung einer orthographischen Eingabe in die phonetische 
20 Umschrift eine zweite Umsetzereinheit zur Umsetzung aus der 

phonetischen Umschrift in die erwahnte pseudo-orthographische 
Darstellung und eine Ausgabeeinheit zur Ausgabe in dieser 
Darstellungsform auf . 



25 Fur die erwahnte Fortbildung des Verfahrens, die dem Benutze 
eine korrigierende Eingabe unter Nutzung der pseudo-orthogra-' 
phischen Darstellung ermoglicht, weist die Vorrichtung eine 
entsprechende dritte Umsetzereinheit auf. 

30 Zur Anwendung der erwahnten Phonem-Graphem-Zuordnungstabelle 
verfiigt die Vorrichtung in einer bevorzugten Aus fuhrungs form 
liber einen entsprechenden Speicher, in dem diese Zuordnungs- 
tabelle fur die zweite und/oder dritte Umsetzereinheit zu- 
greifbar gehalten wird. 



35 



Vorteile und Zweckmafiigkeiten der Erfindung ergeben sich im 
ubrigen aus den Unteranspriichen sowie der nachf olgenden Be- 
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schreibung einer bevorzugten Ausfiihrungsform anhand der Fi- 
gur . 

Die Figur zeigt eine schematische Darstellung einer Sprach- 
5 verarbeitungsvorrichtung 1 zur Durchftihrung des erf indungsge- 
maBen Verfahrens in einer Ausfiihrungsform in Form eines Funk- 
tions-Blockschaltbildes . Die Sprachverarbeitungsvorrichtung 1 
umfafit eine akustische Eingabeeinheit 3, an deren Ausgang ein 
vorverarbeiteter Sprachstrom SI bereitsteht, der einem 
10 Eingang einer Spracherkennungseinheit 5 zugefuhrt wird/ die 

einen geschriebenen Text 32 ausgibt. Die Spracherkennungsein- 
heit 5 urtifaBt einen Vokabularspeicher 5a, in deiti - in der bei 
herkommlichen Spracherkennungssystemen iiblichen phonetischen 
Notation - das Vokabular der Spracherkennungseinheit gespei- 
15 chert ist. 

Der Vokabularspeicher 5a wird laufend durch die Eingabe zu- 
satzlicher Begriffe mittels einer alphanumerischen Eingabe- 
einheit 7 aktualisiert, die aus dem orthographischen Eingabe- 
20 format in einer ersten Umsetzereinheit 9 in die phonetische 

Umschrift (Lautschrif t ) umgesetzt werden. Ein Lexikonspeicher 
11 unterstUtzt die Umsetzungsprozedur in der ersten Umsetzer- 
einheit 9, Zur Priifung und Korrektur vorgenommener Eingaben 
ist eine zweite Umsetzereinheit 13 zur Umsetzung der phoneti- 
schen Umschrift in eine pseudo-orthographische Darstellung 
vorgesehen. Diese wird auf einem Bildschirm 15 fUr den Benut- 
zer angezeigt* 



Weiterhin ist eine dritte Umsetzereinheit 17 zur Umsetzung 
30 pseudo-orthographischer Eingaben uber die alphanumerische 

Eingabeeinheit 7 in phonetischer Notation vorgesehen, deren 
Ausgang mit dem Vokabularspeicher 5a der Spracherkennungsein- 
heit 5 verbunden ist. Der zweiten und dritten Umsetzereinheit 
13, 17 ist ein in Form eines Lookup-Table organisierter 
35 Zuordnungsspeicher 19 fur vorbestimmte Phonem-Graphem-Zuord- 
nungen zugeordnet • 
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Eine durch den Benutzer erfolgte Eingabe eines neuen Begrif- 
fes in korrekt orthographischer Notation wird in der ersten 
Umsetzereinheit 9 in Lautschrift umgesetzt und kann - je nach 
konkreter organisation des Systems in dieser Form bereits dem 
5 Vokabularspeicher 5a zugeftlhrt werden. In jedem Falle wird 

das in Lautschrift lamgesetzte Wort aber der zweiten Umsetzer- 
einheit 13 zugeftlhrt/ wo eine weitere Umsetzung in eine 
pseudo-orthographische Darstellung erfolgt, die auf dem Bild- 
schirm 15 angezeigt wird und den Benutzer dazu veranlafit, 

10 ggfs. liber die Eingabeeinheit 7 - nunmehr in der pseudo- 
orthographischen Darstellung, die auch auf dem Bildschirm 
erscheint - eine korrigierende Eingabe zu machen oder aber 
die angezeigte pseudo-orthographische Darstellung zu bestati 
gen. Die pseudo-orthographische Eingabe wird in der dritten 

15 Umsetzereinheit 17 in Lautschrift umgesetzt und nun (erstmals 
Oder, falls das Wort bereits bei der ersten Eingabe in den 
Vokabularspeicher 5a ubernommen wurden, in einem Korrekturmo- 
dus) dem Vokabularspeicher 5a zugeftlhrt. Dessen Inhalt ist 
damit um eine hinsichtlich der phonetischen Notation geprtlfte 

2 0 Vokabel erweitert. 

Das oben beschriebene Vorgehen wird nachfolgend an zwei Bei- 
spielen erlautert : 

25 1. Beispiel 

Ober die alphanumerische Eingabeeinheit 7 wird in korrekt 
orthographischer Schreibweise eingegeben: "Jacques Chirac". 
In der ersten Umsetzereinheit 9 wird daraus die phonetische 

30 Notation gebildet: "sh a xk sh i : rr a xk" . Die zweite 

Umsetzereinheit 13 bildet daraus "sch a k sch i r a k", und 
in dieser Notation wird der eingegebene Name auf dem Bild- 
schirm 15 angezeigt. Aus dieser Darstellung lafit sich - ohne 
Kenntnis des in der ersten Umsetzung verwendeten phonetischen 

35 Alphabets - erkennen, dafi die vom System erzeugte phonetische 
Notation adaquat ist. Der Nutzer kann das Umsetzungsergebnis 
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bestatigen, und der neu eingegebene Name gelangt (in phoneti- 
scher Notation) in den Vokabularspeicher 5a. 



2. Beispiel 

Uber die Eingabeeinheit 7 wird eingegeben "Professional Ser- 
vice". Die erste Umsetzereinheit 9 erzeugt daraus in phoneti- 
scher Notation 

"pro: f ae sh o n :e: 11 s oe r v i : cc :e". Im Ergebnis 
der weiteren Umsetzung in der zweiten Umsetzereinheit 13 
ergibt sich daraus in pseudo-orthographischer Notation: 
"Prof aschonell Sorwieke", und diese Darstellung wird wieder 
auf dem Bildschirm 15 angezeigt. 

15 Der Nutzer erkennt ohne weiteres, daB die vom System erzeugte 
Lautschrift nicht korrekt sein kann^ insofern sie nicht der 
iiblichen Aussprache der eingegebenen Wortkombination 
entspricht- Der Benutzer wird nun mittels der Eingabeeinheit 
unter Nutzung der pseudo-orthographischen Notation, die auf 
20 dem Schirm dargestellt ist, eine Korrektur vornehmen, und das 
Korrekturergebnis wird in der dritten Umsetzereinheit 17 aus 
der pseudo-orthographischen wieder in die phonetische Nota- 
tion umgesetzt und in dieser in den Vokabularspeicher 5a 
^ ubernommen- Beim gegebenen Beispiel wird der Benutzer also 

• 5 eingeben "Prof aschonnell Sorwis", und entsprechend wird die 
neue Wortkombination (in phonetischer Notation) im Vokabular- 
speicher verankert. 

Es ist einzusehen, dafi das angegebene Verfahren auch mehr- 
30 schrittig ausgefuhrt werden kann, indem nach einer ersten 

Korrektur durch den Benutzer nochmals eine Umsetzung aus der 
phonetischen Notation in die pseudo-orthographische und eine 
weitere Anzeige in dieser Darstellung erfolgt, so daB ggfs. 
Systemfehler iterativ behoben werden konnen. Bevorzugt ist 
35 hierbei die Anwendung eines - an sich bekannten - selbstler- 
nenden Systems etwa in Gestalt eines neuronalen Netzes, mit 
dem eine Selbstadaption des Speicherinhaltes des Zuordnungs- 



10 
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speichers 19 und/oder der Zuordnungsvorschrif ten des ersten 
Umsetzungsvorganges (orthographisch - phonetisch) erfolgen 
kann. 

5 Die Ausfiihrung der Erfindung ist nicht auf das oben beschrie- 
ben Beispiel beschrankt/ sondern auch in einer Vielzahl von 
Abwandlungen moglich, die im Rahmen f achmannischen Handelns 
liegen. 
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PatentansprUche 

1 . Verf ahren zur Sprachverarbeitung, bei dem in einem ersten 
Umsetzungsschritt eine Umsetzung einer orthographischen 

5 Eingabe in eine phonetische Umschrift erfolgt und ein Schritt 
der Priifung und Korrektur des Uitisetzungsergebnisses durch den 
Nutzer vorgesehen ist, 

gekennzeichnet durch 

einen zweiten Schritt der Umsetzung aus der phonetischen 
10 Umschrift in eine pseudo-orthographische Darstellung und die 
Ausgabe in dieser Darstellung. 

2. Verf ahren nach Anspruch 1, 
gekennzeichnet durch 

15 einen dritten Schritt der Umsetzung einer in der pseudo- 

orthographischen Darstellung erfolgten Eingabe in die phone- 
tische Umschrift. 

3. Verf ahren nach Anspruch 1 oder 2, 

20 dadurch gekennzeichnet, daB 

der zweite und/oder dritte Umsetzungsschritt eine Umsetzung 
phonetischer Worteinheiten in einfache graphematische 
Schrif t-Einheiten bzw. umgekehrt umfalit. 




• 



4. Verf ahren nach Anspruch 3, 

dadurch gekennzeichnet, daB 
der zweite und/oder dritte Umsetzungsschritt unter Zugriff 
auf eine gespeicherte Phonem-Graphem-Zuordnungstabelle (19) 
ausgefuhrt wird. 



30 



5. Verf ahren nach Anspruch 3 oder 4, 
dadurch gekennzeichnet, daB 
der zweite und/oder dritte Umsetzungsschritt mittels eines 
selbstlernenden Verfahrens, insbesondere unter Nutzung eines 
35 neuronalen Netzes zur f ortlauf enden Aktualisierung der Pho- 
nem-Graphem-Zuordnungstabelle (19), ausgefuhrt wird. 
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6. Vorrichtung (1) zur Durchfiihrung des Verfahrens nach einem 
der vorangehenden Anspruche, mit einer alphanumerischen 
Eingabeeinheit (7) und einer eingangsseitig mit dieser ver- 
bundenen ersten Umsetzereinheit (9) zur Umsetzung einer 

5 orthographischen Eingabe in eine phonetische Umschrift und 
einer Anzeigeeinheit (15) zur optischen Darstellung eines 
eingegebenen WorteS/ 

gekennzeichnet durch 

eine zweite Umsetzereinheit (13) zur Umsetzung aus der phone- 
10 tischen Umschrift in eine pseudo-orthographische Darstellung, 

die ausgangsseitig mit der Anzeigeeinheit verbunden ist, ^ 

7. Vorrichtung nach Anspruch 6, 
gekennzeichnet durch 

15 eine dritte Umsetzereinheit (17) zur Umsetzung einer in der 
pseudo-orthographischen Darstellung erfolgten Eingabe in die 
phonetische Umschrift . 

8. Vorrichtung nach Anspruch 6 oder 1, 
20 da durch gekennzeichnet, dai3 

die zweite und/oder dritte Umsetzereinheit (13, 17) mit einem 
Speicher (19) zur Speicherung einer Phonem-Graphem-Zuord- 
nungstabelle verbunden ist. 




25 9. Vorrichtung nach einem der AnsprUche 6 bis 8, 
dadurch gekennzeichnet, dafi 
die zweite Umsetzereinheit (13) ausgangsseitig mit einem Vo- 
kabularspeicher (5a) einer Spracherkennungseinheit (5) ver- 
bunden ist. 



o 
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Z u s ammen f a s s ung 

Verfahren und Vorrichtung zur Sprachverarbeitung 

5 Verfahren zur Sprachverarbeitung, bei dem in einem ersten 
Umsetzungsschritt eine Umsetzung einer orthographischen 
Eingabe in eine phonetische Umschrift erfolgt und ein Schritt 
der Prlifung und Korrektur des Umsetzungsergebnisses durch den 
Nutzer vorgesehen ist, mit einem zweiten Schritt der Umset- 
10 zung aus der phonetischen Umschrift in eine pseudo-orthogra- 




phische Darstellung und die Ausgabe in dieser Darstellung. 



